Heilung durch Gentherapie?
Mit der Entschlüsselung der genregulatorischen Codes in unseren Zellen ließen sich künftig zahlreiche Krankheiten wie Krebs oder Rheuma besser behandeln. MUDS-Doktorandin Laura Martens will mit ihrer Forschung dazu beitragen.
Im Oktober 2016 trafen sich in London weltweit führende Wissenschaftlerinnen und Wissenschaftler, um über den Aufbau eines Human Cell Atlas zu beraten. Ein Jahrhundert-Projekt – denn mit einem Überblick über das menschliche Zellinventar ließen sich die zellulären Grundlagen von Gesundheit definieren und zahlreiche Krankheiten präziser beschreiben. Zwar werden Zellen als die grundlegendsten Einheiten des Lebens schon lange erforscht, doch noch immer weiß die Menschheit recht wenig über sie. Ein genaues Verständnis der verschiedenen Zelltypen ist aber notwendig: Daraus können neue Einsichten in die Entstehung und Behandlung von sehr unterschiedlichen Krankheitsbildern gewonnen werden, die von Autoimmunkrankheiten wie Rheuma über Herz-Kreislauf-Erkrankungen und chronischen Entzündungsprozessen bis hin zu Krebs reichen können.
Seit Oktober 2020 ist auch Laura Martens von München aus mit dabei, die Geheimnisse der menschlichen Zelle ein wenig zu lüften und arbeitet dazu mit den Datenressourcen des Human Cell Atlas. Die junge Physikerin aus Bremen hatte im vergangenen Jahr gerade ein Master-Studium in Computational Biology in Cambridge abgeschlossen und wollte für die Promotion nach Deutschland zurückkehren. Auf ihrem Twitter-Account landete ein Tweet von Fabian Theis vom Helmholtz Zentrum München (HZM) über die neue Ausschreibungsrunde für die MUDS – die Munich School of Data Science, die Teil der Helmholtz Information & Data Science Academy (HIDA) ist, Deutschlands größtem postgradualen Ausbildungsnetzwerk in Datenwissenschaften. Hier forscht sie nun, nach erfolgreicher Bewerbung, an ihrem Promotionsprojekt „Unraveling the gene regulatory code using single-cell multi-omic data“: „Data Science mit Biologie oder Biomedizin – das ist genau das, was ich gerne mache!“ Betreut wird ihre Arbeit von „Fabian und Julien“, wie Martens vertrauensvoll von ihren beiden Principal Investigators spricht – zwei Experten auf dem Fachgebiet der Computational Biology: Fabian Theis, Leiter des Institute for Computational Biology am HZM und Julien Gagneur, Professor am Fachbereich Informatik der TU München für Computational Molecular Medicine.
Sie nutzt die Daten eines Megaprojekts
Mit ihrer Begeisterung für biomedizinische Themen ist Martens nicht alleine, denn auf allen Kontinenten tragen Menschen in mehr als 1200 Forschungseinrichtungen dazu bei, den Human Cell Atlas (HCA) zu vervollständigen. Damit wollen sie den menschlichen Körper noch besser beschreiben. Allein in Deutschland sind 82 Institute beteiligt, darunter vier Helmholtz-Zentren (Helmholtz Zentrum München, Deutsches Krebsforschungszentrum, Deutsches Zentrum für Neurodegenerative Erkrankungen, Max Delbrück Centrum für Molekulare Medizin). Der Atlas dient dabei als ein Repositorium, in dem die Daten verschiedener Zellanalysen anderen Forscherinnen und Forschern für die weitere Analyse zur Verfügung gestellt werden. Damit ist der HCA ein hervorragendes Beispiel für Open Science – ein Thema, das auch von der Helmholtz-Gemeinschaft im Sinne von Wissenschaft und Gesellschaft aktiv vorangetrieben wird. Möglich wurde das weltumspannende Forschungsgroßprojekt HCA durch eine Technik, die erst vor etwa fünfzehn Jahren entwickelt wurde: die Einzelzell-RNA-Sequenzierung (Single Cell RNA Sequencing). Mit ihr lässt sich untersuchen, welche RNA-Moleküle in einer einzelnen Zelle vorhanden sind, um somit auf die spezifische Funktion – oder auch Dysfunktion – dieser Zelle schließen.
Bevor die Einzelzellsequenzierung möglich war, konnte man das genetische Material einer Gewebeprobe lediglich unspezifisch betrachten, ohne auf Unterschiede zwischen den Zellen eingehen zu können – und das, obwohl in einem Organ sehr viele unterschiedliche Zelltypen vorliegen. Martens, die in ihrem Projekt auf Daten zurückgreift, die mit diesem Verfahren gewonnen werden, benutzt ein ansprechendes Bild: Eine solche Gewebeprobe müsse man sich ähnlich wie einen „Smoothie“ vorstellen – ein schöner Mix aus verschiedenen Zelltypen. Bei einer Analyse dieses Materials erhalte man dementsprechend einen Mittelwert über alle im Mix enthaltenen Zellen. „Jetzt, bei Single Cell“, so Martens weiter, „nimmt man den Smoothie, kann aber daraus ersehen, dass darin drei Erdbeeren und fünf Heidelbeeren enthalten sind; daher ist man jetzt in der Lage, sich einzelne Zellen anzuschauen, um zu sehen, was in ihnen vorgeht.“
Zelle ist nicht gleich Zelle
Das eigentliche Forschungsobjekt, die einzelne Zelle, oder, um im Bild zu bleiben: die Heidelbeere, unterliegt höchster Komplexität. Denn Zelle ist nicht gleich Zelle: Zwar enthalten alle Zellen des menschlichen Körpers die identische Kopie des Genoms, etwa 3 Milliarden Basen, doch weisen sie drastische Unterschiede in ihrer Morphologie und ihren Verhaltensweisen auf. Aber auch Zellen, die man bislang einem identischen Typus zugerechnet hatte, unterscheiden sich. Ging man lange Zeit davon aus, dass im menschlichen Körper etwa 300 verschiedene Zelltypen zu finden seien, weiß man aufgrund der viel genaueren Kenntnisse über deren biochemisches „Aussehen“, dass diese Zahl wesentlich größer sein muss: Viele Zelltypen lassen sich nämlich dank der Einzelzell-RNA-Sequenzierung in weitere Unterkategorien differenzieren. Sichtbar ist dies an der RNA: Sie übermittelt die in der DNA verschlüsselten Baupläne für Proteine an die Ribosomen, die „Werkstätten“ der Zelle, wo die entsprechenden Proteine synthetisiert werden. Ein Blick auf den kompletten RNA-Katalog einer Zelle zeigt daher, welche Gene dort aktiv sind und wie die Zelle reguliert wird.
Dass eine Zelle zu einem ganz spezifischen Zelltyp wird, verantworten verschiedene Mechanismen, die im Einzelnen noch nicht erforscht sind: die sogenannten gene regulatory elements, die genregulierenden Elemente. Sie bestimmen, wie ein Gen der Zell-DNA „exprimiert“ wird – etwa ob und wie die Transkription eines Gens oder der Auf- und Abbau der RNA abläuft. Diese verschiedenen Schritte innerhalb der Proteinbiosynthese sind entscheidend dafür, wie die genetische Information einer Zelle in Erscheinung tritt. An ihnen lässt sich erkennen, welche Funktion die Zelle hat und wie ihre Entwicklung verläuft. Mit anderen Worten: Warum wird die Heidelbeere zur Heidelbeere?
Martens will sich nun einige dieser genregulierenden Mechanismen anschauen – und ihr Zusammenspiel entschlüsseln. Begonnen hat sie mit einem Vorgang, der ganz am Ende der Proteinbiosynthese steht: dem Abbau der RNA. „Am liebsten würde ich natürlich alles gleichzeitig verstehen wollen“, sagt Martens, „aber zunächst probiere ich mich an diesem letzten Element, das den Abbau der RNA betrifft.“ Dieses besondere Biomolekül, das die Erbinformation der DNA überträgt und nötig ist, um die eigentliche Protein-Synthese einzuleiten, besteht immer nur relativ kurzfristig. Hat die RNA jedoch länger Bestand, etwa stunden- oder tagelang, können auch mehr Proteine produziert werden; sie wird mehrfach genutzt. Die Geschwindigkeit des RNA-Abbaus hat somit ebenso einen Effekt auf die Gen-Expression wie die vielen anderen genregulierenden Mechanismen – und ist wie diese auf der DNA-Sequenz verschlüsselt.
Die rätselhafte Kombinatorik der Genregulation
Martens ist sich des unübersichtlichen Ineinandergreifens von verschiedenen genetischen Informationen, das sie künftig weiter ausleuchten möchte, bewusst: „Man muss es sich vorstellen, wie ein riesiges Netzwerk oder eine riesige Kombinatorik, die zusammenspielt und von der man noch gar nicht genau weiß, wie sie eigentlich funktioniert. Es ist wahnsinnig komplex und man kann diese verschiedenen Elemente noch gar nicht richtig auseinanderdröseln.“ Und sie fügt hinzu: „Auch ich fühle mich manchmal überwältigt von der Komplexität!“ Doch scheint dies für die Wissenschaftlerin kein Grund zur Kapitulation zu sein, sondern – im Gegenteil – ihr eigentlicher Ansporn. Denn schon im nächsten Moment sprudelt die Begeisterung für ihr neues Forschungsterrain aus ihr heraus: „Das ist ja auch das wahnsinnig Faszinierende daran, dass sich dieses Netzwerk über die Evolution so entwickelt hat! Es ist so kompliziert, dass man es durch das bloße Beobachten der Daten gar nicht mehr entschlüsseln kann. Und das ist auch der Grund, warum nun Deep Learning ins Spiel kommt.“
Denn immer dort, wo die Daten für den Menschen unüberschaubar werden, kann Künstliche Intelligenz helfen. Martens arbeitet daran, auf der Grundlage der komplexen Daten aus der Einzelzellsequenzierung ein allgemeines computergestütztes „Framework“ zu entwickeln, sprich: ein Programm zu schreiben. Dieses soll systematische Untersuchungen ermöglichen, die sich mit den jeweils zelltypspezifischen genregulierenden Mechanismen befassen. Dabei soll es so flexibel sein, dass es auf mehrere Einzelzell-Sequenzierungsdaten verallgemeinert werden kann und mehrere Schritte der Genexpression, vom Beginn der Transkription bis zur Auflösung der RNA, modelliert. Um den genregulatorischen Code von Zellen künftig lesbar zu machen, will Martens auch Machine-Learning-Modelle nutzen, die helfen sollen, die eingespeisten Daten qualitativ zu interpretieren: „Die Single-Cell-Daten verraten uns, welche Gene wie stark exprimiert sind. Uns geht es aber darum, zu verstehen, warum das so ist. Ich möchte daher wissen: Welcher Input war besonders wichtig in einem Datensatz?“ Nutzbar wäre ein solches Programm etwa für Forschende, die die genregulierenden Mechanismen bestimmter, für die Funktionsweise eines Organs wichtiger Zelltypen verstehen möchten – zum Beispiel für diejenigen Wissenschaftlerinnen und Wissenschaftler aus der Research Group um Fabian Theis, die am Human Lung Cell Atlas mitarbeiten – ein weiteres Projekt, das im Kontext des Human Cell Atlas steht.
"Man weiß häufig noch nicht, was überhaupt kaputt ist"
In den ersten Monaten ihrer Promotion ging es für Martens hauptsächlich darum, die Daten in ein Format zu bekommen, auf das Machine-Learning Tools angewendet werden können. Die Hauptarbeit der Doktorandin: Ganz viel am Computer sitzen. Und das mehr als zuvor: Im Lockdown findet nicht nur der tägliche Austausch mit den beiden Laboren online statt, sondern auch der regelmäßige Kontakt mit den anderen neuen MUDS-Promovenden über alle disziplinären Grenzen hinweg – etwas, das Martens am Programm der MUDS sehr schätzt. Das Klischee des lebensfremden Rechner-Nerds erfüllt die aufgeschlossene Promovendin daher überhaupt nicht – auch wenn sie, wie sie lachend sagt, den ganzen Tag über an Codes tüftele. „Als ich angefangen habe zu studieren, hätte ich nie gedacht, dass ich mal die ganze Zeit Programmcodes schreiben würde“, gibt sie zu.
Als jemand, die sich eher als „Theoretikerin“ bezeichnet, scheint das Programmieren aber keine große Hürde, sondern vielmehr die eigentliche Berufung gewesen zu sein. Ihre Data Science-Kenntnisse helfen Martens dabei, von diesem großen und komplexen Netzwerk, das die Genregulation darstellt, wenigstens einen kleinen Teil zu verstehen – und so die medizinische Forschung bei der Suche nach neuen Therapiemöglichkeiten zu unterstützen. Das ist Martens Motivation: „Viele Krankheiten basieren auf der DNA. Wenn man verstanden hat, wie deren Bausteine miteinander interagieren und sich beeinflussen, dann kann man natürlich versuchen, an einzelnen Stellen etwas zu reparieren. Im Moment weiß man häufig noch nicht, was überhaupt kaputt ist.“ Die Aussicht auf gentherapeutische Behandlungen, etwa durch Genomchirurgie, scheint am fernen Horizont des Human Cell Atlas auf. Laura Martens Beitrag dazu, die Enträtselung des genregulatorischen Codes der Zellen, erscheint dabei so, wie es auch die Initiatoren und Initiatorinnen des Human Cell Atlas für ihr historisches Forschungsprojekt formuliert haben: „ehrgeizig, aber erreichbar“.
Autorin: Constanze Fröhlich